\chapter{Conceptos Preliminares}

	\section{Biología}
	Este concepto inicial es nuestro punto de partida para ingresar al tema que vamos a introducir. 
	Definiciones varias caracterizan a la biología como el estudio del origen y evolución de los seres vivos así como sus propiedades. Entre estas características que se estudian son su morfogenia, reproducción, patologías,etc. 
	Esta ciencia trata de establecer leyes generales que rigen la vida orgánica y sus fundamentos.
	Esta disciplina abarca muchas áreas de estudio, en nuestro caso nos interesaremos en el campo de la biología molecular.
	
	\subsection{Taxonomía Biológica}
	Comenzaremos definiendo la clasificación de los seres biológicos a través de un estudio de taxonomía el cual los clasifica según una jerarquía dada por su parentesco e historia evolutiva. La Fig. 2.1 muestra la clasificación taxonómica de las especies.
	
	\begin{figure}[h!]
	\centering
	\includegraphics[scale=0.5]{pictures/taxonomy.png}
	\caption{Taxonomía de las especies.} 
	\end{figure} 	
	
	\subsection{Organismo}
	Es un conjunto de átomos y moléculas que forman una estructura muy organizada y compleja. Cada organismo en particular posee una serie de características biológicas que nombramos a continuación:
	
	\begin{itemize}
	\item Organización: como es la composición del mismo, si unicelular o pluricelular.
	\item Homeostasis: regulación de su sistema interno para mantener un estado constante.
	\item Irritabilidad: reacción de los estímulos externos.
	\item Metabolismo: un organismo consume energía para transformarla en nutrientes (anabolismo) y liberan energía al descomponer la materia orgánica (catabolismo).
	\item Desarrollo: los organismo cambian de tamaño al consumir nutrientes.
	\item Reproducción: capacidad de producir copias de si mismo de forma sexual o asexual.
	\item Adaptación: como se adapta a un cierto ambiente a medida que evoluciona.
	\end{itemize}
	
	\subsubsection{Composición de los Organismos}
	Hasta ahora vimos cuales son las propiedades de los organismos en general, en este punto haremos una breve explicación de como esta conformado un organismo.	
	Los organismos son sistemas físicos soportados por reacciones químicas complejas, organizadas de manera que promueven la reproducción y en alguna medida la sustentabilidad y la supervivencia del mismo.
	La materia viva está constituida por unos 60 elementos, casi todos los elementos estables de la Tierra, exceptuando los gases nobles. Estos elementos se llaman bioelementos o elementos biogénicos. Se pueden clasificar en dos tipos: primarios y secundarios.
	
	\begin{itemize}
	\item Primarios: son los indispensables para formar la materia orgánica. Son el hidrógeno, el carbono ,el oxigeno, el nitrógeno, el fósforo y el azufre.
	\item Secundarios: son lo elementos restantes.
	\end{itemize}
	
	\subsection{Moléculas orgánicas}
	Tenemos dos tipos de moléculas orgánicas básicas:
		\subsubsection{Nucleótidos}
		Son moléculas de pequeña masa que conforman estructuras más complejas (ej. el ADN y el ARN). Hay seis posibles nucleótidos:
		
		\begin{enumerate}
		\item Adenina (A) compone el ADN y el ARN.
		\item Guanina (G) compone el ADN y el ARN.
		\item Timina (T) compone el ADN.
		\item Citosina (C) compone el ADN y el ARN.
		\item Uracilo (U) compone el ARN.
		\item Flavina (F) no componen ni el ADN ni el ARN.
		\end{enumerate}
		
		\subsubsection{Aminoácidos}
		Son moléculas que conforman a las proteínas y son esenciales para la vida. Presentamos una tabla con los aminoácidos y sus abreviaciones de tres y una letra.\\

\begin{center}
	\begin{tabular}{|ccc|}
	\hline Nombre & Ab. 3 letras & Ab. 1 Letra \\ 
	\hline Alanine & Ala & A \\ 
	\hline Arginine & Arg & R \\ 
	\hline Asparagine & Asn & N \\ 
	\hline Aspartic acid & Asp & D \\ 
	\hline Cytesine & Cys & C \\ 
	\hline Glutamic acid & Glu & E \\ 
	\hline Glutamine & Gln & Q \\ 
	\hline Glycine & Gly & G \\ 
	\hline Histidine & His & H \\ 
	\hline Isoleucine & Ile & I \\ 	
	\hline Leucine & Leu & L \\ 
	\hline Lysine & Lys & K \\ 
	\hline Methionine & Met & M \\ 
	\hline Phenylalanine & Phe & F \\ 
	\hline Proline & Pro & P \\ 
	\hline Serine & Ser & S \\ 
	\hline Threonine & Thr & T \\ 
	\hline Tryptophan & Trp & W \\ 
	\hline Tyrosine & Tyr & Y \\ 
	\hline Valine & Val & V \\ 
	\hline 
	\end{tabular} 
\end{center}


	\subsection{Macromoléculas}
	Son estructuras biológicas compuestas de un pequeño numero de moléculas fundamentales.
	Tenemos cuatro categorías de macromoléculas:
	
		\subsubsection{Ácidos Nucleicos}
		Son conformadas por secuencias de nucleótidos que los organismos utilizan para almacenar información.
		Dentro del ácido nucleico, un codón es una secuencia particular de tres nucleótidos que codifica un aminoácido particular, mientras que una secuencia de aminoácidos forma una proteína.		
		Haremos hincapié en dos de los ácidos nucleótidos mas importantes.		
		
		\begin{enumerate}
		\item \textbf{ADN (Ácido desoxirribonucleico)} contiene la información genética usada para el desarrollo y el funcionamiento de los organismos vivos conocidos y de algunos virus, siendo el responsable de su transmisión hereditaria.	(Fig. 2.2)	
		\item \textbf{ARN (Ácido ribonucleico)} esta presente tanto en las células procariotas como en las eucariotas, y es el único material genético de ciertos virus (virus ARN). (Fig. 2.2)
		\end{enumerate}
		
	
		\begin{figure}[ht!]
		\centering
		\includegraphics[width=\linewidth]{pictures/dna_rna.png}
		\caption{ADN y ARN.} 
		\end{figure} 	
	
		
		\subsubsection{Proteínas}
		Están formadas por secuencias de aminoácidos que debido a sus características químicas se pliegan de una manera especifica y así realizan una función particular. Existen distintas clases como las enzimas, proteínas estructurales, reguladoras, etc.		
		\subsubsection{Glúcidos:} Son el combustible básico de toda célula.
		\subsubsection{Lípidos:} Constituye la barrera interior de una célula evitando que sustancias puedan entrar y salir de ella.
	
	\subsection{Células}
	Son las unidades básicas que conforman el organismo. Dentro de estas ocurren toda las funciones vitales ademas de contener información para transmitir a sus herederas. Se clasifican en dos tipos:
	\begin{enumerate}
	\item Procariotas: carecen de membrana nuclear.
	\item Eucariotas: tiene un núcleo bien definido que contiene al ADN.
	\end{enumerate}
	
	\subsubsection{Estructura de una célula}
	A modo gráfico presentamos la composición de las células eucariotas y procariotas.Ver Fig. 2.3.
	
	\begin{figure}[h!]
	\centering
	\includegraphics[width=\linewidth]{pictures/cells.jpg}
	\caption{Células Procariota y Eucariota.} 
	\end{figure} 
	
	\subsection{Virus}
	Es una entidad infecciosa microscópica que puede multiplicarse dentro de las células de otro organismo. 
	
		
	\subsection{Las Células CD4}
	Las células CD4 (también conocidas como células T, células T ayudantes o células T4) pertenecen a un grupo de glóbulos blancos llamados linfocitos. Estas células se distinguen por dos cosas, no sólo son el blanco de ataque del VIH, sino que también tienen la responsabilidad de coordinar la manera en que el sistema inmunológico responde a las infecciones que causan enfermedades. Cuando el recuento de CD4 (número de células en un milímetro cúbico de sangre o mililitro de sangre) desciende por debajo de 200, se considera que el sistema inmunológico está debilitado y se corre un riesgo mayor de padecer una infección oportunista relacionada al SIDA, como la neumonía por Pneumocystis.
	
	
%---------------------------------------------------------------------------------------------------------------------------------------------
\section{El Virus del VIH}
En esta sección haremos una descripción de uno de los virus mas letales y polémicos que afectan la salud de millones de personas y cobran vidas de otras tantas. Esta introducción acompaña al tema que trata nuestro trabajo de tesis, la obtención de terapias para pacientes con VIH. 
	\subsection{Historia y descubrimiento}
	El Virus de Inmunodeficiencia Humana ataca al sistema inmunológico, en particular a las células CD4 o T4 de las cuales necesita para reproducirse, dejando al organismo bajo en defensas ante otras enfermedades. Fue descubierto en 1983 por el equipo francés de Luc Montagner \cite{Mont83} como la causa del SIDA. Una vez introducido en el organismo el virus debe encontrar células susceptibles para poder replicarse:
El proceso de replicación requiere una serie de pasos:
	
	\begin{enumerate}
	\item Absorción : El receptor celular (CD4) es reconocido por un antireceptor en la proteína $gp120$ expuesta en la envoltura viral. Una segunda molécula celular conocida como correceptor debe ser también reconocida.
	\item Fusión: en este  paso se produce la fusión entre la envoltura viral y la membrana plasmática de la célula permitiendo la penetración de la capside (estructura protéica) viral que contiene el genoma y enzimas necesarias para replicación.	
	\item Transcripción Reversa: esta produce un ADN utilizando como molde el ARN viral, posteriormente se sintetiza una doble cadena de ADN-VIH que migra hacia el núcleo de la célula infectada.
	\item Integración: en esta fase el ADN-VIH se integra al ADN celular. Utiliza la integrasa para realizar esta transformación.
	\item Transcripción: desde este momento el ADN comienza a producir ARN-VIH. Al ser este un proceso natural de la célula, ningún sistema de defensa es alertado. Es decir, en esta transcripción el ADN es utilizado como molde para generar ARNv que va a formar parte de la progenie viral. Además produce un ARN especial denominado ARNm(mensajero) que es necesario para sintetizar el resto de las proteínas y enzimas que el virus requiere.
	\item Ensamblaje: El ARNv y enzimas necesarias para la replicación se rodean de proteínas de la capside.
	\item Brotación: la cápside viral adquiere una envoltura arrastrando parte de la membrana plasmática en la cual se han incluido glicoproteínas (proteína compuesta con varios hidratos de carbono) de origen viral.
	\item Maduración: gracias a la acción de la proteasa, se produce la maduración final del nuevo virus que se vuelve así plenamente infectivo. A partir de este punto el nuevo virus está preparado para atacar otras células CD4.
	\end{enumerate}
	
	\subsection{Su transmisión}
	Existen tres vías principales de infección:
	
	\begin{enumerate}
	\item Sexual: producido por el acto sexual sin protección.
	\item Parenteral: la transmisión por sangre producto de la utilización de jeringas infectadas que se utilizan para la aplicación de drogas intravenosas o por transfusiones de sangre sin control respectivo.
	\item Vertical: es la infección de madre a hijo que se produce en las ultimas semanas de embarazo, en el parto o en la lactancia.
	\end{enumerate}
	
	\subsection{La enfermedad del SIDA}
	Una vez que se ha confirmado que la persona es portadora del VIH, es probable que en un determinado momento desarrolle SIDA (Síndrome de Inmunodeficiencia Adquirida). Es difícil predecir si esto finalmente sucederá y cuándo, pues depende de la capacidad de respuesta del sistema inmune de cada individuo y de la eficacia de los tratamientos. Vale aclarar que una persona con VIH pasa a desarrollar un cuadro de SIDA cuando su nivel de células CD4 se encuentra por debajo de 200 células por mililitro de sangre.
	
	\subsection{Datos estadísticos}
	Según los datos recopilados por ONUSIDA (\url{http://www.unaids.org}) en nuestro país el $0.6\%$ (aproximadamente 240.000 personas) de la población padece VIH-SIDA siendo aproximadamente unos 40 millones de infectados en todo el mundo. 	
	
	\subsection{Tratamientos y avances en la medicina}
	Actualmente el único tratamiento posible para diezmar el avance del VIH es la aplicación de antirretrovirales que tienen como finalidad interferir en algunos de los procesos (antes mencionados) que el virus realiza. Lamentablemente estas terapias no son efectivas a largo plazo, ya que dada la aplicación de un fármaco, este deja de ser efectivo al cabo de unos meses debido a que el virus muta para poder evitar la acción del mismo. En el capítulo siguiente se explica con mayor detalle como son los tratamientos basados en terapias antirretrovirales en nuestro país y el mundo.

\section{Los Antirretrovirales}
Como se mencionó anteriormente, los fármacos utilizados para el tratamiento del virus del VIH son los denominados antirretrovirales. Existe una variedad de éstos provenientes de distintos laboratorios, cada uno con sus características, precios y forma de acción ante el virus. Clasificándolos por su rango de acción, hay dos clases de antirretrovirales, los Protease Inhibitors (PI) y Reverse Transcriptase Inhibitors. Dentro de la segunda clase hay dos subtipos que son los Nucleotide Reverse Transcriptase Inhibitors (NRTI) y los Non-Nucleotide Reverse Transcriptase Inhibitors (NNRTI). Existen otras dos clases mas recientes que son los Fusion or Entry Inhibitors y los Integrase Inhibitors. 
Cuando un antirretroviral se le suministra a un paciente, produce un efecto en el virus diezmándolo e inhibiéndolo durante un cierto tiempo.
Vale aclarar que la mayoría de los antirretrovirales son altamente tóxicos con lo cual su dosis tiene que ser bien aplicada, así como tener en cuenta cuál es la dosis mínima indispensable.
A continuación exhibimos una tabla con los antirretrovirales aprobados por la FDA (Food and Drugs Administration \url{http://www.fda.gov/MedicalDevices/default.htm}) .\\

Múltiples Clases Combinadas (Multi-class combinations):
\begin{center}
\begin{tabular}{|c|c|c|}
\hline Combinación & Comercial & Aprobación \\ 
\hline EFV + TDF + FTC & Atripia & 12-Jul-06 \\ 
\hline d4T + 3TC + NVP & - & Tentative only* \\ 
\hline AZT + 3TC+ NVP & - & Tentative only* \\ 
\hline 
\end{tabular}
\end{center}

Inhibidores de Transcriptasa Reversa Nucleósidos (NRTIs):

\begin{center}
\begin{tabular}{|c|c|c|c|}
\hline Abreviación & Genérico & Comercial & Aprobación \\ 
\hline 3TC & lamivudine & Epivir & 17-Nov-95 \\ 
\hline ABC & abacavir   & Ziagen & 17-Dec-98  \\ 
\hline AZT o ZDV & zidovudine & Retrovir & 19-Mar-87 \\ 
\hline d4T & stavudine & Zerit & 24-Jun-94  \\ 
\hline ddI & didanosine & Videx EC & 31-Oct-00  \\ 
\hline FTC & emtricitabine & Emtriva & 02-Jul-03 \\ 
\hline TDF & tenofovir & Viread & 26-Oct-01  \\ 
\hline 
\end{tabular}
\end{center}

Inhibidores de Transcriptasa Reversa No Nucleósidos (NNRTIs):

\begin{center}
\begin{tabular}{|c|c|c|c|}
\hline Abreviación & Genérico & Comercial & Aprobación \\ 
\hline DLV & delavirdine & - & 04-Apr-97 \\ 
\hline EFV & efavirenz   & Sustiva & 17-Sep-98 \\ 
\hline ETR & etravirine & Intelence & 18-Jan-08 \\ 
\hline NVP & nevirapine & Viramune & 21-Jun-96 \\ 
\hline 
\end{tabular}
\end{center}

NRTIs Combinados (Combined NRTIs):

\begin{center}
\begin{tabular}{|c|c|c|}
\hline Combinación & Comercial & Aprobación \\ 
\hline ABC + 3TC & Epzicom (US) & 02-Aug-04  \\ 
\hline ABC + AZT + 3TC & Trizivir & 14-Nov-00 \\ 
\hline AZT + 3TC & Combivir & 27-Sep-97  \\ 
\hline TDF + FTC & Truvada & 02-Aug-04  \\ 
\hline d4T + 3TC & - & Tentative only*  \\ 
\hline 
\end{tabular}
\end{center}

Inhibidores de Proteasa (Protease Inhibitors) (PIs):

\begin{center}
\begin{tabular}{|c|c|c|c|}
\hline Abreviación & Genérico & Comercial & Aprobación \\
\hline APV & amprenavir & Agenerase & 15-Apr-99  \\ 
\hline FOS-APV & fosamprenavir & Lexiva (US) & 20-Oct-03 \\ 
\hline ATV & atazanavir & Reyataz & 20-Jun-03 \\ 
\hline DRV & darunavir & Prezista & 23-Jun-06 \\ 
\hline IDV & indinavir & Crixivan & 13-Mar-96 \\ 
\hline LPV/RTV & lopinavir + ritonavir & Kaletra & 15-Sep-00 \\ 
\hline NFV & nelfinavir & Viracept & 14-Mar-97	 \\ 
\hline RTV & ritonavir & Norvir & 01-Mar-96 \\ 
\hline SQV & saquinavir & Invirase & 06-Dec-95 \\ 
\hline TPV & tipranavir & Aptivus & 22-Jun-05 \\ 
\hline 
\end{tabular} 
\end{center}

Inhibidores de Fusión o Entrada (Fusion or Entry Inhibitors):

\begin{center}
\begin{tabular}{|c|c|c|c|}
\hline Abreviación & Genérico & Comercial & Aprobación \\ 
\hline T-20	& enfuvirtide &	Fuzeon & 13-Mar-03  \\ 
\hline MVC & maraviroc &Celsentri & 18-Sep-07 \\ 
\hline 
\end{tabular}
\end{center}

Inhibidores de Integrasa (Integrase Inhibitors):

\begin{center}
\begin{tabular}{|c|c|c|c|}
\hline Abreviación & Genérico & Comercial & Aprobación \\ 
\hline RAL & raltegravir & Isentress & 12-Oct-07  \\ 
\hline 
\end{tabular} 
\end{center}

\subsection{Fallo Virológico}
El fallo virológico predispone al fallo inmunológico y eventualmente a la progresión de la inmunodeficiencia. El fallo virológico aislado, en ninguna circunstancia, es una causa para discontinuar el tratamiento antirretroviral. Pero en este trabajo lo usamos para hacer referencia a la falta de efectividad en el cóctel de antirretrovirales y su posterior cambio.


\section{Medicina Personalizada}
Es un modelo de aplicación médica que utiliza la información obtenida de un paciente para elaborar y optimizar terapias o tratamientos. También se puede definir a la Medicina Personalizada como un conjunto de productos y servicios que utilizan la ciencia de la genómica y la proteómica para elaborar enfoques de prevención y cuidado personal. Más información en \url{http://www.pwc.com/personalizedmedicine} y \cite{WG09}.


%-----------------------------------------------------------------------------------------------------------------------------------------------
\section{La Bioinformática}
	La bioinformática es la aplicación de las ciencias de la computación a la biología molecular. Esta ciencia comprende gran cantidad de métodos, algoritmos y técnicas estadísticas. Esto ha permitido generar modelos para la aplicación de proteínas, análisis de ADN y generación de modelos gráficos de estas estructuras entre tantas otra aplicaciones.	
	
	\subsection{Alcance}
	La bioinformática comprende la serie de metodologías formales para tratar de una gran cantidad problemas de tipo biológico. Entre ellos:
	
	\begin{enumerate}
	\item Análisis de Secuencias: codificar y analizar secuencias de ADN de distintos organismos.\cite{Li06}
	\item Anotación de Genomas: es el proceso de marcado de los genes y otras características del ADN. \cite{Er03}
	\item Biología Evolutiva computacional: estudio ancestral de las especies. \cite{UNEP92}
	\item Análisis de expresiones genéticas: es el estudio del proceso en el cual los organismos transforma información codificada en proteínas necesarias para su desarrollo.\cite{Wir06}
	\item Análisis de Regulación: se analizan los eventos que comienzan con una señal extracelular (como por ejemplo una hormona) y que conducen al incremente o decremento de una o más proteínas.\cite{King08}
	\item Análisis de expresiones de proteínas: poder analizas las proteínas presentes en una muestra biológica.\cite{Po05}
	\item Análisis de mutaciones del cáncer: poder predecir en base a secuenciaciones de células las mutaciones de algunas de estas y que provocarían el cáncer.\cite{Zh04}
	\item Predicción de estructuras de proteínas: es la traducción de proteínas en base a su conformación de aminoácidos.\cite{Nir68}
	\item Modelado de sistemas biológicos: simulación de sistemas y subsistemas biológicos junto con su posibles comportamientos.\cite{Kit02}
	\end{enumerate}
	
	\subsection{Trabajos}
	Existe una gran cantidad de trabajos relacionados con este área y que han sido de vital importancia para llevar a cabo grandes experimentos y puesta a prueba ciertas teorías. Hacemos referencias a algunos de estos:
	
	\begin{itemize}
	\item Basic Local Alignment Search Tool (BLAST): es un algoritmo para la comparación de estructuras biológicas primarias como proteínas, nucleótidos, aminoácidos o ADN. Posee una gran base de datos de secuencias ya obtenidas. \url{http://blast.ncbi.nlm.nih.gov/Blast.cgi}
	\item pheno2geno: sistema de predicción fenotípica. Este software toma secuencias de ARN del virus del VIH y elabora arboles de decisión basado en probabilidades. \url{http://www.geno2pheno.org/}
	\item NetCTL Server: predicción de epitopes (un antígeno) en secuencias de proteínas. \url{http://www.cbs.dtu.dk/services/NetCTL/}
	\end{itemize}		
	
	\subsection{Estructuras y Algoritmos Bioinformáticos}
	Dada la presentación anterior de las estructuras biológicas básicas damos paso al diseño formal de estas así como algunos algoritmos que son de uso corriente. Recordemos que este trabajo comprende el nivel de estructuras primarias, es decir, las cadenas de nucleótidos y aminoácidos que conforman el ADN y ARN.
	
	\subsubsection{Representación de nucleótidos, aminoácidos y proteínas}
	Representamos a las cadenas de nucleótidos y de aminoácidos que se utilizarán a lo largo del trabajo como cadenas de caracteres. Denotamos a las mismas como expresiones regulares.
	
	\begin{itemize}
	\item $nuc\_arn = a \vert u \vert c \vert g \vert \_$
	\item $nuc\_adn = a \vert t \vert c \vert g \vert \_$
	\item $aminoacido = Ala \vert Arg \vert Asn ...$	
	\end{itemize}
	
	De la misma forma representamos a los genes de ADN, ARN y proteínas.
		
	\begin{itemize}
	\item $gen\_arn = (nuc\_arn)^{+}$
	\item $gen\_adn = (nuc\_adn)^{+}$	
	\item $proteina = aminoacido (aminoacido)^{+}$
	\end{itemize}
	
	\subsubsection{Traducción de ADN a ARN}
	Existe una forma algorítmica de traducir una secuencia ADN a una secuencia de ARN. Consiste analizar cada nucleótido de la cadena de ARN cambiando cada $t$ por $u$.
	
	\begin{lstlisting}[basicstyle=\tt, frame=trBL, tabsize=4,fontadjust=true]
	arn_gen = traslate(adn_gen), donde: 
		
	arn_gen translate(adn_gen) 
	{
	  forall nuc_adn in adn_gen do 
	  {
	    if nuc_adn is t then replace(nuc_adn, u)
	  }
	}	
	\end{lstlisting}
	
	\subsubsection{Traducción de ARN a proteínas}
	Podemos traducir la secuencia de ARN (compuesta de nucleótidos) a una secuencia de proteínas (compuesta de aminoácidos). Cada aminoácido es correspondido por tres nucleótidos. Denominamos a esta cadena de tres caracteres como $triplete$ o codón. El algoritmo toma cada triplete y lo traduce a un aminoácido correspondido por la tabla del código genético (Sección 14.1).\\
	
	\begin{minipage}{\linewidth}
	\begin{lstlisting}[basicstyle=\tt, frame=trBL, tabsize=4,fontadjust=true]
	protein = translate(arn_gen), donde:
		
	protein translate(arn_gen)
	{
	  i = 0
	  do
	  {
	    triplet = substr(arn_gen, i, 3)
		if triplet != STOP then 
		{
		  aminoacid = genetic_code(triplet)			
		  protein += aminoacid
		  i += 3				
		}		
	  }loop until triplet == STOP or i>= length(arn_gen)
	}
	\end{lstlisting}
	\end{minipage}
	
	
